其他
爬虫玩得好,牢饭吃到饱?这3条底线千万不能碰!
导读:合法合规、谨慎小心地应用爬虫技术。
在被告推出搜索引擎伊始,其网站亦刊载了Robots协议的内容和设置方法,说明包括被告在内的整个互联网行业对于Robots协议都是认可和遵守的。其应当被认定为行业内的通行规则,应当被认定为搜索引擎行业内公认的、应当被遵守的商业道德。
案情事实
判决结果
尽量避免爬取构成直接竞争关系的企业的平台数据,避免竞争对手依据《反不正当竞争法》提起诉讼的风险。 尽量爬取明确公开的数据,遵守Robots协议等网站明确公开的协议,避免爬取平台禁止爬取的数据。 根据《数据安全管理办法(征求意见稿)》第16条的要求,数据爬取收集流量不得超过网站日均流量的三分之一,避免造成目标网站崩溃、无法正常运营等情况。 对于目标网站已经明确采取技术手段阻止爬虫访问的,公司不应侵入、破坏其防护措施。 如目标网站明确发出停止数据爬取的相关通知说明,则应暂停数据爬取行为,及时采取对策。
转载请联系微信:DoctorData
推荐语:多年一线治理经验的系统总结!跟随主人公不断成长,快速掌握多元场景中的实务处理方案!企业数据合规治理的实用工作手册!数据合规专业人士成长晋阶的秘笈!
关于作者:孟洁,现任北京市环球律师事务所合伙人,主要执业领域为网络安全、个人信息与隐私保护。曾在多家知名企业担任法务负责人和数据保护官,任IAPP中国区知识社区主席,被钱伯斯、The Legal 500、LEGALBAND等知名法律评级机构评为 “TMT领域领军人物”“数据保护领域领军人物”“Fintech领域头部律师”等,被北京市律协评为全国千名涉外专家律师。薛颖,长期在互联网集团担任数据合规与知识产权总监。在外企、世界五百强公司等从事过多年数据隐私合规工作,拥有丰富的互联网场景一线经验。持有CIPP/E、CIPP/U认证,当选ALB中国知识产权法务15强并带领团队获得过《商法》年度“数据合规”优秀团队等奖项。朱玲凤,现任知名互联网公司隐私及数据合规专家,曾任小米安全与隐私委员会隐私副主席。多年从事数据隐私合规研究和实务工作,深入参与国内信息安全相关标准拟定和重要法律研讨等,在全球隐私法律研究、隐私保护设计、隐私安全技术应用与管理以及App、物联网、人工智能等领域有丰富的实践经验。
划重点👇
在公众号对话框输入以下关键词查看更多优质内容!
读书 | 书单 | 干货 | 讲明白 | 神操作 | 手把手大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化AI | 人工智能 | 机器学习 | 深度学习 | NLP5G | 中台 | 用户画像 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都关注了这个公众号👇